Cognitive Inference:认知推理下的常识知识库资源、常识推理测试评估与中文实践项目索引
作者 | 刘焕勇
责编 | 李雪敬
CognitiveInference
Cognitive Inference,认知推理、常识知识库、常识推理与常识推理评估的系统项目,以现有国内外已有的常识知识库为研究对象,从常识知识库资源建设和常识推理测试评估两个方面出发进行整理,并结合自己近几年来在逻辑性推理知识库的构建、应用以及理论思考进行介绍。具体包括已有常识知识库项目资源介绍、逻辑推理类知识库的项目实践集合、常识推理测试评估项目集合。
项目介绍
常识推理是人工智能的高级阶段,基于已有知识,运用知识推理机技术,完成限定领域决策行为,能够在充分减少人为劳动的同时,产生经济效益。例如,基于已知知识进行知识推理,采用如事件驱动传导路径等进行知识发现,能够辅助于业务的推理和辅助决策,在智能投研进行未知风险预警、在舆情分析中对公司进行舆论控制和监控。
“逻辑知识库”+"逻辑推理机"的混合协作模式,是目前实现以上目的的重要方式。
"逻辑知识库"作为描述现实社会事件之间传导关联的库,需要在规模、质量,领域针对性三个方面入手进行解决。具体地,作者通过对自己所涉及的推理项目进行系统回顾,认为,推理类常识知识库,应该从纵向和横向两个维度出发进行构建。
一、纵向常识逻辑
1、上下位关系图谱项目:HyponymyExtraction.
二、横向常识逻辑
三、常识逻辑推理
开放常识知识库与常识推理评测项目
本项目对现有国内外已有的常识知识库为研究对象,从常识知识库资源建设和常识推理测试评估两个方面出发进行整理,形成已有常识知识库资源集合、常识推理评测项目集合两个组成部分。
一、已有常识知识库资源集合
大类 | 小类 | 名称 |
语言学知识库 | 语言标注语料库 | Penn Treebank |
语言学知识库 | 语言标注语料库 | The Penn Discourse Tree- bank (PDTB) |
语言学知识库 | 语言标注语料库 | The Abstract Meaning Representation (AMR) corpus |
语言学知识库 | 词汇知识库 | WordNet |
语言学知识库 | 词汇知识库 | VerbNet |
语言学知识库 | 词汇知识库 | VerbOcean |
语言学知识库 | 词汇知识库 | VerbCorner |
语言学知识库 | 框架语义知识库 | FrameNet |
语言学知识库 | 框架语义知识库 | PropBank |
语言学知识库 | 预训练语义向量 | GloVe |
语言学知识库 | 预训练语义向量 | FastText |
语言学知识库 | 预训练语义向量 | wordpiece embeddings |
常识库 | 常识库 | YAGO |
常识库 | 常识库 | DBpedia |
常识库 | 常识库 | WikiTaxonomy |
常识库 | 常识库 | Freebase |
常识库 | 常识库 | NELL |
常识库 | 常识库 | Probase |
常识库 | 常识库 | Wikidata |
常识知识库 | 常识知识库 | Cyc |
常识知识库 | 常识知识库 | ConceptNet |
常识知识库 | 常识知识库 | SenticNet |
常识知识库 | 常识知识库 | Isanette and IsaCore |
常识知识库 | 常识知识库 | COGBASE |
常识知识库 | 常识知识库 | WebChild. |
常识知识库 | 常识知识库 | LocatedNear |
常识知识库 | 常识知识库 | ATOMIC |
常识知识库 | 常识知识库 | ASER |
常识知识库 | 常识知识库 | 学迹实时事理系统 |
如需查看对应地址,请在文末的原文链接进入
二、常识推理评测项目资源
大类 | 名称 | 作者 | 规模 |
Reference Resolution | Winograd Schema Challenge | Morgenstern et al., 2016 | 60 |
Reference Resolution | WinoGrande | Sakaguchi et al., 2019 | 44.0K |
Question Answering | MCTest. | Richardson et al., 2013 | 2.00K |
Question Answering | RACE. | Lai et al., 2017 | 97.7K |
Question Answering | NarrativeQA. | Kocˇiský et al., 2018 | 46.8K |
Question Answering | ARC | Clark et al., 2018 | 7.79K |
Question Answering | MCScript | Ostermann et al., 2018 | 13.9K |
Question Answering | ProPara | Mishra et al., 2018 | 488 |
Question Answering | MultiRC. | Khashabi et al., 2018 | 9.87K |
Question Answering | ARCT | Habernal et al., 2018 | 2.45K |
Question Answering | SQuAD. | Rajpurkar et al., 2018 | 151K |
Question Answering | CoQA. | Reddy et al., 2018 | 8.40K |
Question Answering | QuAC. | Choi et al., 2018 | 98.4K |
Question Answering | OpenBookQA. | Mihaylov et al., 2018 | 5.96K |
Question Answering | CommonsenseQA | Talmor et al., 2019 | 9.40K |
Question Answering | DREAM. | Sun et al., 2019 | 10.2K |
Question Answering | DROP. | Dua et al., 2019 | 96.6K |
Question Answering | Cosmos QA. | Huang et al., 2019 | 35.6K |
Question Answering | MC-TACO. | Zhou et al., 2019 | 1.89K |
Textual Enatailment | RTE Challenges. | Bentivogli et al., 2011 | 48.8K |
Textual Enatailment | Conversational Entailment. | Zhang & Chai, 2009 | 875 |
Textual Enatailment | SICK. | Marelli et al., 2014a | 9.84K |
Textual Enatailment | SNLI. | Bowman et al., 2015 | 570K |
Textual Enatailment | SciTail. | Khot et al., 2018 | 27.0K |
Textual Enatailment | SherLIiC. | Schmitt & Schütze, 2019 | 3.99K |
Plausible Inference | COPA. | Roemmele et al., 2011 | 1.00K |
Plausible Inference | CBT. | Hill et al., 2015 | 687K |
Plausible Inference | ROCStories. | Mostafazadeh et al., 2016 | 98.2K |
Plausible Inference | LAMBADA. | Paperno et al., 2016 | 10.0K |
Plausible Inference | JOCI. | hang et al., 2017 | 39.1K |
Plausible Inference | CLOTH. | Xie et al., 2017 | 99.4K |
Plausible Inference | SWAG. | Zellers et al., 2018 | 114K |
Plausible Inference | ReCoRD. | Zhang et al., 2018 | 121K |
Plausible Inference | HellaSWAG. | Zellers et al., 2019a | 70.0K |
Plausible Inference | AlphaNLI. | Bhagavatula et al., 2019 | 171K |
Intuitive Psychology | Triangle-COPA. | Gordon, 2016 | 100 |
Intuitive Psychology | Story Commonsense. | Rashkin et al., 2018a | 161k |
Intuitive Psychology | Event2Mind. | Rashkin et al., 2018b | 57.1K |
Intuitive Psychology | SocialIQA. | Sap et al., 2019b | 44.8K |
Multple Tasks | bAbI. | Weston et al., 2016 | 40.0K |
Multple Tasks | Inference is Everything. | - | - |
Multple Tasks | GLUE. | - | - |
Multple Tasks | DNC. | Poliak et al., 2018a | 570K |
Multple Tasks | SuperGLUE. | - | - |
关于作者
更多精彩推荐